Debate de Agentes con Principios: Arbitraje contra Sicofanía en LLMs
Descubre cómo el debate adversarial entre modelos con principios reduce la sicofanía en LLMs, logrando hasta un 53% de precisión con arbitraje ciego.
Descubre cómo el debate adversarial entre modelos con principios reduce la sicofanía en LLMs, logrando hasta un 53% de precisión con arbitraje ciego.
HAZDIAL usa diálogo multi-agente para identificar peligros críticos. Compara debate adversarial y discusión constructiva optimizando seguridad operacional.